查看原文
其他

AI双城记:对话“最强大脑”,深入“魔法学校”,探访“绝密实验室”

真格基金 2022-09-15

The following article is from 红杉汇 Author 洪杉

李飞飞、吴恩达、张潼、马维英、Pieter Abbeel、Oussama Khatib ……;腾讯、阿里、今日头条、滴滴、科大讯飞、唯品会、斯坦福、UC 伯克利、清华……集齐全球顶尖的 AI 领域领军人物,踏访中美两国科学研究及应用探索前沿的科技公司/大学的 AI 实验室,浓缩在飞越太平洋的 9 天内密集拜访和交流,这是一种什么感受?


一句话:大脑的“CPU”、“存储空间”和“接口”都已不够用。


本文转载自红杉汇 | ID : Sequoiacap


9 月 14 日-22 日,真格基金携手红杉中国,定向邀请三十余位成员企业的创始人和高管,一起享受了一场智能超感的“北京-硅谷 AI 双城记”之旅。这是一次名副其实的大脑体操,对于在各个垂直领域已经取得初战胜果的创业者们,这更像是一趟寻找 AI+商业“终极算法”的解惑之旅。真格基金创始人徐小平和红杉资本全球执行合伙人沈南鹏也参与了“AI 双城记”硅谷段的部分活动环节,两位都非常关心 AI 产业将对教育领域带来哪些改变。

真格基金创始人徐小平:工业时代是把流水线上的人变成机器,而AI时代则是把机器变成人。AI的广泛应用,如果能够极大提高生产力、极大地解放人类,将是非常了不起的事情。


红杉资本全球执行合伙人沈南鹏:人工智能是信息科技高速发展的重要产物,如果企业家能够把握好未来5-10年市场研发方向与机会,应当可以获得前所未有的长足进步,获得跨越式发展。




未来竞争的壁垒不再是算法

而是数据拥有的量和质


从 1950 年代中期人工智能概念的第一次被提出,及至今天出现的三次人工智能浪潮,各类算法已趋近成型。而从应用层来看,监督学习、迁移学习、非监督学习、强化学习这四类算法所创造的经济效益是递减的,就目前而言,AI 技术做出的经济贡献几乎都来自第一种:监督学习,也就是让机器学会从 A 到 B,从输入到输出的映射。它依靠结构化数据,确实比非结构化数据创造了更多的经济效益,并且已经扩展到在线广告、消费金融、语音交互、机器翻译等应用场景中。


此次拜访的多位 AI 大牛都谈到,当算法模型的优劣已不再是关键差异(就像所有安卓手机都系出安卓平台),未来科技公司在 AI 应用上的较量更多取决于谁拥有更多、更好的数据。以及,怎么策略性地持续获取更多数据。


如此图所示,处于金字塔顶端的结构化数据,将是任何一家公司的宝藏。




 AI建立数据获取和训练的飞轮

对手就很难追赶你

在此行“AI 双城记”中,创业者向谷歌云机器学习与人工智能首席科学家李飞飞教授提出了这样一个问题:大公司毫无疑问拥有巨大的数据获取优势,那么创业公司还有机会吗?


李飞飞的回答是,大公司在获取跟自己产品相关的数据方面,这一优势肯定是无法匹及的。但是,AI 应用的场景是多种多样的,在许多领域还有待开掘。对于初创公司来说,怎么通过产品来撬动数据获取才是最重要的。


吴恩达也持同样观点。他在白板上一边画图一边解释:一家新公司需要特地设计一个循环:先为算法收集足够的数据,这样就能推出产品;然后通过这个产品来获取用户,而用户会提供更多的数据……启动了这一飞轮后,对手就很难追赶你。


以今日头条为例。今日头条副总裁、人工智能实验室负责人马维英在分享中亦提到,用户使用今日头条越多,会发现它越智能。原因就是,用户会在使用时不断喂给机器第二轮大数据:他的偏好、点击次数、停留时长、负向反馈……从而让头条更懂用户。


就如同互联网时代已经发生过的故事那样:大平台之外,还有诸多垂直细分的数据领域有待挖矿。




大数据不追求因果性

更追求相关性


原因是,只依据统计数据是不足以得出变量之间的因果性的。想要得出因果性,必须从理论上证明两个变量之间确实有逻辑上的因果性,并且要排除掉第三个隐含变量同时影响这两个变量的可能性。就像著名的啤酒尿布的故事,它只是说明这两项商品的购买人群中存在较大概率的重合度。


正如“AI 双城记”团员、唯品会美国研发中心总经理、AI 负责人谢楠在分享中提到 AI 技术有几大趋势:算法“开源化”,计算“云服务化”,数据“私有化”。因此,就算法、数据和运算能力这三大 AI 要素来说,企业最需要建立起壁垒的是数据。AI 的商业应用与学术论文研究有所不同,算法模型的准确率不必是唯一的研发目标。在有限的时间与资源的情况下,也许有商业 ROI 更高的研发目标,譬如算法对某业务场景的覆盖范围。在特定的应用场景中,80%的算法模型准确率可能就可以做很多过去做不到的事情。如何在不完美准确率的情况下构建一个可行的商用场景是真正挑战商业 AI 实践者的地方,需要对业务及客户需求有深刻的洞察与理解。



传统科技公司+机器学习/神经网络≠AI 公司


吴恩达分享的主题就是:当 AI 成为新的电力,它将怎样改变世界?


AI 的崛起正在改变公司间竞争的基础,那么,到底什么才是真正的 AI 公司?吴恩达首先谈到了互联网时代,究竟如何定义什么是互联网公司这件事——商场 + 网站 ≠ 互联网公司。


“我认识一家大型零售公司的 CIO,有一次 CEO 对他说:我们在网上卖东西,亚马逊也在网上卖东西,我们是一样的。”但其实不是的,互联网公司应该如何定义呢?不是看你有没有网站,而是看做不做 A / B 测试、能不能快速迭代、是否由工程师和产品经理来做决策。这才是互联网公司的精髓。


同样地,现在经常听人说“AI 公司”。在 AI 时代,我们同样要知道:传统科技公司 + 机器学习/神经网络 ≠ AI 公司。吴提出三个衡量维度——


第一,AI 公司倾向于策略性地获取数据。


第二,AI 公司通常有统一的数据仓库。


第三,普遍的自动化以及对人工智能产品经理的新定位(从哪儿获取数据,如何获取数据,对数据精准度的要求)。



机器学习就是,让机器学习怎样学习


OpenAI 研究员、加州大学伯克利分校教授 Pieter Abbeel,和 OpenAI 创始人、YC 总裁 Sam Altman 在与“AI 双城记”团员的分享中,均提到了他们的最新研究方向——在小数据的前提下发展 AI:让机器学会“学习”,在自训练(self-play)中训练智能体。


Pieter Abbeel 更为具体地提到了一个有效的方法——元学习( Meta Learning ):给系统很多训练数据,最后得到的是一个自学习的系统,它会随着获得的数据进行更新和快速的学习。


这颠覆了传统的深度学习模式必定需要大量数据集的情况,意味着其实深度学习也可以在少量数据的情况下,得到不错的结果。


其中一个应用领域就是医疗诊断。对于一些发病率并不那么高的肿瘤类疾病,无法获得大量 CT 数据来训练机器学会识别肿瘤,就可以使用类似的相关联数据进行初步训练。红杉中国 Family 成员企业推想科技正是这么做的。其本质就是,教会神经网络怎样从模仿人类行为,到自主学习,犹如婴儿的成长。




AI应用需要从进化力、执行力上升到理解力


阿里巴巴的技术专家们这样谈到他们对 AI 应用的理解:


进化力是互联网公司的看家本领,在网络时代,可以比传统企业更快速地迭代、试错、响应用户需求,而这正是开发 AI 应用的一大优势。


而上升到第二阶段就是执行力——你能够连接服务的数量、被新的交互手段所赋能的执行力,就变得非常重要。也就是怎样让 AI 真正在实际场景中应用起来。


再往前推演,就是理解力。怎样让 AI 自我学习、自我进化,理解环境、人的需求甚至具有自我意识。从计算、算法到数据,都对机器的理解力提出更高的要求。


由此看来,进化力体现在 AI 在商业上的浅层次应用上;而执行力则会考虑企业是否能够用 AI 改造自我基因,转变为真正的 AI 公司;在理解力层面,则意味着,AI 不仅是机器处理流程的自动化,单纯替代人力的机械性劳动,而是具有创新创造的能力。



没有改变的用户需求仍然是这两个字

“爱”和“怕”


在万紫千红的移动互联网时代,从用户需求的角度来说,几乎所有服务应用其实都可以归为这两类:“爱”,让用户享受到便利、折扣、好处、愉悦,于是越来越沉迷其中、爱不释手,社交、电商、游戏、文娱、资讯、工具类 APP 均可以归为这一类;“怕”,则是让用户拥有免于某种恐惧的自由,比如杀毒、隐私、医疗、安全类应用。


在不同时期,解决这两类需求的新方式,总会带来新的商业机会。AI 时代亦会如是。


滴滴信息安全战略副总裁、滴滴研究院副院长、Didi Labs 负责人弓峰敏博士是硅谷资深的信息安全专家,他谈到了 AI 时代将会面临的各种可能的技术安全问题,可一窥硬币的另一面。


在他看来,机器学习本身的确增加了方法和模型的复杂度,和软件时代一样,复杂程度本身就是一个可能引起更多漏洞和威胁的弱点。但在今天来说,AI 应用引发黑客攻击的可能性实际上已经不是新鲜的事情,越来复杂的机器学习,已经有对抗的味道在里面了。这意味着,机器需要做更多自适应的学习,不断更新,去应对可能出现的安全风险。


从另一方面说,给机器喂的训练所需的数据时就要考虑到,其应用场景是什么样的,对于噪音、干扰、信息污染的承受程度是怎样的,如果预见性差,很可能致使这一学习系统被误导,其学习结果也相对不会理想。


也因此,解决 AI 未来应用的安全性问题,也会是一个蓬勃兴起的新领域。



AI 时代,人类将真正第一次

在最本质意义上复原成“智人”


越过奇点后,人类的工作越来越多被机器替代,人还何以为人?关于这个问题,已经让社会学家、未来学家和经济学家争论许久。真格基金联合创始人王强老师在此次“AI 双城记”的一次分享中,谈到了他的理解:


“这一场 AI 越来越凸显特色的智能化革命,实际上就是两个方向。一是不断释放人的大脑所承载了千百年的所有功能,这是继工业革命之后,释放人脑潜力、释放人力资源的又一次革命。用越来越用智能化、高效率的方式,来替代人脑不应该承载的任务。


“另一方面,当人脑的部分工作被人工智能所解放,它必定在呼唤着新的东西。就像人作为灵长类高等动物,古生物学家给人类的祖先命名为‘智人’,随着 AI 的不断演进,可能人将真正第一次在最本质意义上复原成为‘智人’。”


不仅是 AI 在学习人类,人类也在和机器的互动中学习。就像围棋高手们也从 AlphaGo 的很多新颖的走法中获得启发。相信在未来世界,这样的交互会越来越频繁的发生,对教育来说,AI 将带来一些重要的改变,从教育产品到教育本身都会有,它会让人类变得更聪明。

 行程掠影

9月14日・北京


 

 

今日头条


张一鸣

今日头条创始人张一鸣:AI技术本身具有网络效应,越多人用越好用,用得越久越好用,信息越多,模式识别得足够多,就越是准确。系统仿佛会自我发育。


今日头条副总裁兼AI实验室主任马维英:头条在AI技术的使用上是“杀鸡就用牛刀”,很多人都认为简单的阅读推荐其实用不到太多AI技术,但是头条通过深度的挖掘,在AI 技术的使用过程中发现了巨大价值。

马维英


不仅聆听张一鸣和马维英博士的分享,我们还品尝了今日头条的免费员工午餐。


清华大学姚班 

 



四位教授徐恪唐平中李建徐葳给我们上了干货满满的四节课。


 科大讯飞

用语音与科大讯飞的AI体验交互,并与科大讯飞研究院副院长、北京研究院院长王士进交流到深夜。


王士进:有效降低人工智能技术难度有四招:1.忘却技术,通过多种手段组合降低对人工智能的技术依赖;2.给技术提供更多信息,减少候选或预判的结果倾向;3.延迟决策,让技术有更多的机会判断效果好坏;4.监督限定。

王士进


9月15日・北京

 

 

阿里巴巴


在阿里巴巴专场,AI LabsiDST阿里云大数据的专家们分享阿里的AI战略。

腾讯 

 


 
 



腾讯AI实验室主任张潼:主要关注四个大方向上的发展。首先是基于AI技术交互的全新智能硬件;其次是与产业的结合比如无人驾驶,智能医疗等;第三是大数据;第四是云服务。

张潼


9月18日・硅谷



 唯品会


唯品会美国总经理谢楠分享AI如何帮助企业节流、增效、开源。


硅谷大讲堂  

华源科技协会 (HYSTA) 主席陈立峰先生对话真格联合创始人王强老师,与硅谷华人工程师交流AI应用、回国创业的话题,王强老师分享:人类会不会复原为“智人”?

 


 李飞飞分享


李飞飞教授:AI应用的场景多种多样,在许多领域还有待开掘。对于初创公司来说,通过产品来撬动数据获取才是最重要的。

1.红杉资本全球执行合伙人沈南鹏先生与谷歌云机器学习与人工智能首席科学家李飞飞教授对话创业者;

2.真格基金创始人徐小平老师聆听李飞飞教授答创业者问;

3.李飞飞教授、沈南鹏先生、徐小平老师与“团员”们合影。


9月19日・硅谷 


 

弓峰敏分享


滴滴研究院副院长弓峰敏分享:AI时代的信息安全挑战 

Jonathan Levav 分享 

 

 



斯坦福大学商学院教授 Jonathan Levav分享:是什么影响了我们的决定?


 

 加州大学伯克利分校


Pieter Abbeel

加州大学伯克利分校AI实验室负责人Pieter Abbeel教授讲解机器学习的“元学习”秘密。


走进加州大学伯克利分校做高校巡讲,真格基金创始人徐小平老师与联合创始人王强老师在校园巡讲期间同框。


9月20日・硅谷

 


 

Y Combinator


拜访 Y Combinator

对话YC总裁Sam Altman:AI如何更“Open”


斯坦福大学 


斯坦福大学机器人实验室负责人Oussama Khatib教授讲述深海探测机器人“Ocean One”的诞生故事。 

 

斯坦福大学校园巡讲,”AI双城记”成员们面向200余位高校学生分享丰富的AI应用场景,并不遗余力地吸引人才加入自己的企业。

 

9月22日・硅谷

 

 

吴恩达分享


吴恩达“上课” :AI如何成为新时代的电力

Andrew Feldman 分享  


Cerebras Systems创始人兼CEO Andrew Feldman与来自中国的创业者们一起交流AI智能硬件的前景。



推荐阅读

顶级 AI 探访

中国顶级AI Lab探访:今日头条、清华姚班、讯飞、阿里、腾讯都在做什么?

 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存